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Resumen 


La hidrología ha utilizado métodos tradicionales para pronosticar niveles 
de inundación. Sin embargo, éstos pueden generar problemas de 
precisión, causados por el comportamiento no lineal de las inundaciones 
y las limitaciones al no incluir todas las variables, como flujo, y nivel de 
agua y precipitación. En consecuencia, algunos científicos comenzaron a 
utilizar métodos no convencionales basados en modelos de inteligencia 
artificial, pronosticando las inundaciones de manera más precisa y 
rigurosa. Este artículo presenta una comparación de un modelo de 
tránsito de flujo unidimensional desarrollado en HEC-RAS y un modelo 
de inteligencia artificial, basado en redes neuronales artificiales, 
desarrollado en MatLab, para predecir inundaciones. El análisis de los 
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resultados se llevó a cabo utilizando seis indicadores estadísticos: error 
absoluto medio (MAE, por su nombre en inglés); error cuadrático medio 
(MSE); error medio porcentual absoluto (MAPE, por su nombre en 
inglés); raíz cuadrada de la MSE; coeficiente de correlación de Pearson 
(CC, por su nombre en inglés), y coeficiente de correlación de 
concordancia (pc, por su nombre en inglés). Además, el coeficiente de 
eficiencia se calculó empleando una herramienta virtual llamada 
Hydrotest. A partir del análisis se observó en los modelos de pronóstico 
que el uso de redes neuronales tiene resultados precisos, dada su 
cercanía con los datos reales: MAPE, entre 11.95 y 12.51; CC, entre 
0.90 y 0.92; pc, entre 0.84 y 0.87, y finalmente un CE más grande que 
0.8. El estudio se realizó en una sección de las partes altas del río 
Bogotá, en Colombia, entre las estaciones hidrológicas de puente 
Florencia y Tocancipá. Los datos de flujo fueron tomados por la 
Corporación Autónoma Regional de Cundinamarca (CAR) de septiembre 
de 2009 a octubre de 2013. 


Palabras clave: redes neuronales, HEC-RAS, modelo físico, modelo 
inteligente, pronóstico de inundaciones. 


Abstract 


Hydrology has used traditional methods for flood level forecasting. 
However, this type of forecast can lead to accuracy issues, caused by 
the nonlinear behavior of floods and limitations by not including all 
variables, such as water flow, level and precipitation. Consequently, 
some scientists began to use unconventional methods based on artificial 
intelligence models, to forecast floods more precisely and rigorously. 
This paper compares the HEC-RAS one-dimensional flow transit model 
with an artificial intelligence model based on Artificial Neural Networks, 
developed in MatLab to predict floods. The results were analyzed using 
six statistical indicators: mean absolute error (MAE), mean squared 
error (MSE), mean absolute percentage error (MAPE), square root of the 
MSE, Pearson correlation coefficient (CC), and concordance correlation 
coefficient (pc). In addition, the efficiency coefficient was calculated, and 
used in a virtual tool called Hydrotest. The analysis shows that forecast 
models that use neural networks have accurate results, given their 
closeness to the real data: MAPE between 11.95 and 12.51, CC between 
0.90 and 0.92, pc between 0.84 and 0.87, and a coefficient of efficiency 
larger than 0.8. The study was conducted on a section of the upper 
Bogotá River, in Colombia, between the Florence Bridge and Tocancipá 
hydrological stations. Flow data was taken from the Regional 
Autonomous Corporation of Cundinamarca (CAR), from September 2009 
to October 2013. 
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Introducción 


Las inundaciones son fenómenos naturales que se producen cuando las 
lluvias se presentan de manera frecuente o son tan fuertes que la 
capacidad de absorción del suelo es sobrepasada, generando que el 
agua cambie de curso y se extienda hacia las zonas adyacentes al 
mismo (SDAB, 2009). Cuando estos fenómenos ocurren en entornos 
urbanos que se encuentran poblados, las consecuencias se hacen más 
notorias, pues no sólo se presentan daños en el nivel ambiental, sino 
también en los ámbitos social y económico, pues las entidades 
gubernamentales se ven en la necesidad de desviar grandes recursos 
asignados originalmente a otros sectores de desarrollo, como la 
educación, salud y otros, para recuperar los espacios inundados e 
infraestructura (CAR, 2016). Al respecto, datos del Banco Mundial 
Colombia (2012) muestran que las inundaciones ocasionan 43% de las 
viviendas destruidas y alrededor de 10% de pérdidas de vidas humanas. 
Por otra parte, dos de los eventos con gran variabilidad climática que 
representan mayor amenaza en Colombia son los Fenómenos de "El 
Niño” y “La Niña”. El primero se caracteriza por la presencia de sequías 
y escasez de agua, produciendo incendios forestales. Por otro lado, el 
fenómeno de “La Niña” presenta una mayor saturación de humedad de 
los suelos, lo que acarrea eventos como deslizamientos e inundaciones 
repentinas en los sistemas hídricos, que para el caso de Colombia se 
dan sobre todo en la región Andina, Caribe y Pacífica. Para enero de 
2011 fue necesario declarar estado de emergencia económica, social y 
ecológica en todo el territorio colombiano debido a los devastadores 
efectos generados por las inundaciones. La Corporación Autónoma 
Regional (CAR), que administra la cuenca del río Bogotá, sostiene que 
es necesario contar con modelos probabilísticos que estimen la 
variabilidad climática e identifiquen el aumento del volumen de los ríos, 
considerando que a través de ellos se puedan crear alertas de desastres 
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naturales y obtener información útil al momento de la toma de 
decisiones con respecto a la prevención de emergencias (CAR, 2016). 


Sobre este aspecto, tradicionalmente la hidrología recurre a métodos 
unidimensionales de pronóstico de caudales con los cuales se 
determinan las inundaciones mediante regresiones lineales (Pandey 8 
Nguyen, 1999), que miden la relación entre las variables dependientes e 
independientes del fenómeno (Weisberg, 2005). El inconveniente han 
sido los problemas y limitaciones que han tenido en el área de la 
predicción, no sólo por el cambio climático que se está dando en la 
tierra (Huffman, 2001), o la dificultad de calibración y las herramientas 
de optimización robustas que se necesitan (Kia et a/., 2011), sino 
porque este tipo de fenómenos son no lineales, lo que hace inapropiado 
el uso de este tipo de modelos predictivos (Dawson, Abrahart, 
Shamseldin, 8 Wilby, 2006; Agil, Kita, Yano, 8 Nishiyama, 2007). Como 
se expuso antes, si bien los métodos tradicionales han sido de gran 
ayuda a la hora de pronosticar inundaciones, los investigadores se han 
dado a la tarea de estudiar nuevos modelos más eficientes, que tengan 
mayor exactitud en el pronóstico. 


Otra forma en la que se hace pronóstico de inundaciones es empleando 
los modelos físicos basados en principios hidráulicos, que permiten 
explicar a través de leyes físicas unidas con ecuaciones diferenciales el 
comportamiento de los cauces de los ríos. Algunas de las ecuaciones 
estudiadas son las de Saint-Venant, que han sido útiles en modelos de 
tránsito; sin embargo, se ha evidenciado que cuando la lámina de flujo 
crece rápidamente, en algunas ocasiones genera soluciones inestables 
debido a la alta acumulación de errores, por lo que se requiere de una 
matemática de mayor complejidad y una modelación más precisa 
(Amarís, Guerrero, 8 Sanchez, 2015). 


Otro problema de los modelos físicos es la cantidad de información que 
requieren, en términos de variables hidrometeorológicas (caudal, nivel 
de agua y precipitación, entre otras), además de las consideraciones de 
los aspectos geológicos y topográficos del cauce, como batimetría del 
terreno, tipos de suelos, curvas de gasto y parámetros de escurrimiento 
(Merwade, Cook, € Coonrod, 2008; Kia et a/., 2011). Lo anterior limita 
la aplicación de este tipo de modelos, dado que ciertas cuencas no han 
sido caracterizadas en términos de la capacidad de almacenamiento, 
captación de agua y probables zonas de inundación alrededor del río 
(Werner, Gallagher, € Weeks, 2006; Park, Joo, € Kim, 2012; Callow 8 
Boggs, 2013). 


El modelo físico analizado en esta investigación es el llamado modelo de 
tránsito de caudales, el cual predice el cambio de magnitud, velocidad y 
forma de una onda de flujo en función del tiempo (hidrograma), en uno 
o más puntos a lo largo de un cauce o canal de agua (Chow, Maidment, 
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8 Mays, 1994). Esta modelación unidimensional fue realizada 
empleando el software HEC-RAS, creado por el ejército de los Estados 
Unidos (US Army Corps Engineers € Hydrologic Engineering Center, 
2016), el cual ha sido utilizado en diversos trabajos para simulación 
hidráulica (Manfreda et a/., 2014; Guida, Swanson, Remo 8 Kiss, 2015; 
Dimitriadis et a/., 2016). 


Además, el software HEC-RAS ha sido empleado para analizar el riesgo 
de inundaciones, a través de sistemas de simulación hidráulica en 3D, 
2D y 1D (Zazo, Molina, 8. Rodríguez-González, 2015). 


Por otro lado, en la actualidad se han desarrollado estudios de modelos 
de predicción para eventos futuros integrando técnicas de sistemas de 
inteligencia artificial, la cual tiene una estructura matemática flexible, 
que es capaz de modelar relaciones complejas no lineales entre las 
características de los datos de entrada y de salida, para lo cual es difícil 
describir el proceso utilizando ecuaciones físicas (Seckin, Cobaner, 
Yurtal, 8 Haktanir, 2013). Algunas de las técnicas más usadas en el 
campo de la inteligencia artificial para el pronóstico de inundaciones a 
nivel global son las redes neuronales artificiales (RNA), que a través de 
modelos matemáticos inspirados en procesos neurológicos simulan el 
funcionamiento del cerebro para la resolución de problemas (Kalteh, 
2013; Wang, Chau, Cheng, € Qiu, 2009). Otra técnica es la unión entre 
las redes neuronales y los sistemas difusos (ANFIS, por sus siglas en 
inglés), la cual es utilizada para la elaboración de modelos de pronóstico 
(Agil et a/., 2007). Algunos de los casos de aplicación de las RNA como 
sistemas de predicción se muestran en la Tabla 1. 


Tabla 1. Casos de aplicación de modelos de redes neuronales 
artificiales. 


ACI AA 


Kalteh (2013) Desarrolla modelos de predicción implementando técnicas 
de inteligencia artificial 


Nastos, Paliatsos, Pronostican la precipitación máxima diaria 
Koukouletsos, Larissi, 
8: Moustris (2014) 


Tisseuil, Vrac, Lek, 8 | Evalúan modelos estadísticos distintos, entre los cuales 
Wade (2010) están las redes neuronales RNA, para predecir el cambio 
climático, considerando recursos hidrológicos 


Yilmaz, Imteaz, 8 Predicen los flujos de captación de nieve, evaluando 
Jenkins (2011) datos de escorrentía basados en antecedentes 
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Fantin-Cruz et al. Realizan una construcción histórica de zonas de 
(2011) inundación en Brasil usando redes neuronales 


Taormina, Chau, 8 Realizan el pronóstico fluvial de un río a través de la 
Sivakumar (2015) separación del caudal base y la optimización del código 
binario 


Deo € Sahin (2016) Realizan un modelo predictivo de caudal en Queensland, 
simulando el nivel medio del caudal en una máquina de 
aprendizaje extremo (ELM), comparando el rendimiento 
con RN 


Appelhans, Predicen los patrones de temperatura en el monte 
Mwangomo, Hardy, Kilimanjaro con 14 algoritmos de aprendizaje 
Hemp, 8 Nauss 

(2015) 


Deo € Sahin (2015) Pronostican la precipitación estandarizada mensual y el 
índice de evapotranspiración 


En la actualidad, las técnicas de inteligencia artificial se están tomando 
como referente para realizar investigaciones de predicción de eventos 
futuros debido a que emulan el comportamiento no lineal del fenómeno 
para dar un pronóstico más acertado (Zou, Xia, Yang, 8 Wang, 2007); 
en particular, en el campo de la hidrología, las técnicas de inteligencia 
artificial ayudan en la toma de decisiones adecuadas frente al uso del 
agua. 


Este artículo presenta la comparación entre un modelo físico y un 
modelo inteligente para la predicción de niveles de inundaciones en un 
tramo de la cuenca del río Bogotá (Colombia), comprendido entre las 
estaciones hidrológicas de Puente Florencia y Tocancipá. 


Materiales y métodos 


Modelo hidrológico en HEC-RAS 
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Esta herramienta permite hacer modelaciones hidráulicas del 
comportamiento del flujo permanente y no permanente de agua en un 
canal artificial o en un cauce natural, como ríos (US Army Corps 
Engineers, HEC-RAS, 2006). La simulación hidráulica en este software 
se basa en ecuaciones diferenciales determinísticas, que permiten 
pronosticar la dinámica de los niveles de agua en los eventos con 
precipitaciones altas que generan inundación, definiendo las cotas de 
inundación a través de perfiles transversales, simulando de manera 
aproximada el comportamiento de la dinámica del recurso hídrico y del 
cauce con características de sesiones transversales con cualquier 
geometría a lo largo del cauce; distintas profundidades del agua y 
caudal variable a lo largo del cauce, en condiciones de régimen de flujo 
subcrítico o supercrítico, con efectos hidráulicos, debido a obstáculos 
transversales naturales o artificiales en el cauce (Sarhadi, Soltani, 8 
Modarres, 2012; Mohammadi, Nazariha, € Mehrdadi, 2014). 


En cuanto a la simulación del modelo implementado en esta 
investigación, el software HEC-RAS utiliza la ecuación de continuidad 
(US Army Corps Engineers 8 Hydrologic Engineering Center, 2006), que 
describe la conservación de la masa para un sistema unidimensional, 
además de calcular términos de almacenamiento: 


dA , OS 


0Q ES 
Ot Fo a =0(1) 


Donde x = distancia a lo largo del cauce; t = tiempo; Q = caudal; A = 
área de la sección transversal; S = almacenamiento, y qí1 = entrada 
lateral por unidad de distancia. 


Además, para desarrollar la modelación se utilizaron los siguientes 
parámetros de calibración: 


Hidrogramas: gráficas que permiten observar la tasa de flujo o caudal 
en un lugar dado de la corriente (Chow et al/., 1994). 


Curvas de gasto o de calibración: representaciones gráficas de la 
relación existente entre el nivel de agua y su respectivo caudal (Salazar 
8: Chaparron, 1990). 


Secciones transversales: definen la forma del río, sus características 
geométricas y deben estar conectadas topográficamente de modo que 
definen el perfil longitudinal: 

1 
Q =Ks¿ (2) 
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_ 1.486 


IE y) 


n 


donde K = sección transversal; n = coeficiente de rugosidad de Manning 
para la sección; A = área de caudal de la sección, y R = radio hidráulico 
de la sección (área/ perímetro húmedo). 


Coeficiente de Manning: llamado también coeficiente de rugosidad, 
permite estimar la resistencia al escurrimiento que posee un canal 
(Ruberto, Carreras, 8 Depettris, 2003). Cuando se tienen varios 
coeficientes de Manning (nc) en un cauce, el canal principal es dividido 
en N partes, cada uno con el perímetro de humedad Pi y el coeficiente 
de rugosidad n;. 


Ej=a(Pinj? 
A 


donde n. = coeficiente de rugosidad compuesto; P = perímetro de 
humedad del canal principal; P; = perímetro de humedad de la sección lI, 
y n¡ = coeficiente de rugosidad por sección. 


Por lo general, investigaciones realizadas con este software evalúan el 
desempeño del modelo hidráulico en la predicción de inundaciones para 
identificar las zonas vulnerables, infraestructura crítica y el valor del uso 
del suelo afectado (Sarhadi et al., 2012; Zazo et al., 2015). Estudios 
han demostrado que la modelación en HEC-RAS permite evaluar 
diferentes escenarios para el pronóstico de áreas de inundación (Guida 
et al., 2015). Además, este software se usa para optimizar las 
características geométricas de la visualización real de las zonas 
propensas a inundaciones, las cuales puede ser observada después a 
través de un Sistema de Información Geográfica (GIS, por sus siglas en 
inglés) (Sarhadi et a/., 2012). Un caso de estudio es el mostrado por 
Mohammadi et al. (2014), quienes simularon condiciones hidráulicas de 
inundación y áreas inundables para diferentes periodos de retorno, 
utilizando modelos en HEC-RAS, HEC-GEORAS y GIS, obteniendo como 
resultados un análisis de riesgos y daños de las inundaciones. 


Modelo de redes neuronales artificiales 
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La estructura estándar de una RNA (Figura 1) está compuesta por un 
conjunto de neuronas organizadas en capas (de entrada, ocultas y de 
salida), distribuidas de forma jerárquica, constituyendo un sistema 
funcional autónomo (Chen, Chen, Chou, 8: Yang, 2010). En este sistema 
inteligente se identifican los siguientes elementos: variables de entrada 
y de salida; pesos sinápticos, que son la intensidad de interacción entre 
las neuronas; función de propagación; función de activación, y función 
de salida (Komatsu et a/., 2014). El número de capas y de neuronas es 
uno de los parámetros más importantes en la modelación de RNA, pues 
determina la eficiencia del sistema. 


Capa de Capa Capa de 
entrada oculta salida 


Señales ) 
de entrada” 


” Salida 


[e Unidad de entrada 
(O) Unidad neuronal 


Figura 1. Estructura de una red neuronal artificial de retropropagación 
(Chen et al., 2010). 


Una de las ventajas de las RNA es que son una herramienta útil para el 
modelado, cuando la relación entre los datos de entrada y de salida no 
es conocida, razón por la cual este tipo de modelos son llamados de caja 
negra (Chau, Wu, €: Li, 2005; Wang, Wang, Lei, Jiang, € Song, 2011); 
esto permite que a través de sus composiciones matemáticas sean 
capaces de modelar sistemas complejos, como pueden ser los procesos 
hidrológicos (Dawson et al., 2006). Otro de los beneficios derivados de 
las RNA es su capacidad de generar salidas de una combinación 
especifica de entradas y su capacidad de respuesta frente al manejo de 
datos no lineales (Santillán, Fraile-Ardanuy, 8 Toledo, 2014; Cervantes- 
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Osornio, Arteaga-Ramírez, Vázquez-Peña,  Ojeda-Bustamante, 8 
Quevedo-Nolasco, 2013). 


Datos disponibles 


La cuenca del río Bogotá se localiza en el departamento de 
Cundinamarca, Colombia. Tiene una superficie total de 5 891 km?, que 
corresponde a un 32% del total de la superficie departamental. El río 
Bogotá constituye la corriente principal de la cuenca, recorriendo desde 
su nacimiento a los 3 300 metros sobre el nivel del mar (msnm) el 
municipio de Villapinzón hasta su desembocadura al río Magdalena, a los 
280 msnm en el municipio de Girardot, un total de 308 km (CAR, 2006). 


El río Bogotá está dividió en tres subcuencas: alta, media y baja. El 
tramo de estudio está en la cuenca alta (Figura 2), entre las estaciones 
hidrológicas de Puente Florencia, en el municipio de Gachancipá (Aguas 
Arriba), y la estación Tocancipá, en el municipio con el mismo nombre 
(Aguas Abajo). Este tramo se caracteriza por: a) ofrecer registro de 
frecuencia horaria de caudal; y b) estabilidad en el registro, es decir, no 
existe ningún embalse u otro cuerpo hídrico de gran tamaño que altere 
de forma significativa el comportamiento hídrico de la cuenca. 
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Figura 2. Tramo elegido (autores con cartografía suministrada por CAR 
e IGAC). 


De manera adicional, se identificaron 12 subcuencas pequeñas que 
aportan caudales al tramo estudiado que, sumados, aumentan de forma 
considerable el nivel del río en épocas de alta precipitación. Para el 
cálculo del aporte del caudal de cada subcuenca se utilizó el método 
racional basado en los parámetros de forma y red de drenaje, 
empleando las curvas de nivel que le dan forma a cada subcuenca y el 
orden del afluente (Horton, 1945). 


Modelación física empleando el software HEC-RAS 


Para el modelo físico implementado en HEC-RAS fue necesario 
establecer los parámetros de calibración, con los cuales se simularon los 
caudales a la salida del modelo. Los parámetros son los siguientes: 
hidrogramas de las estaciones Puente Florencia y Tocancipá, curvas de 
gasto o de calibración, secciones transversales y coeficiente de Manning. 
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Para el modelo de tránsito de caudales se realizó una simulación con los 
datos de abril, mayo, octubre y noviembre, debido a que en estas 
fechas ocurrieron inundaciones por la alta precipitación; se tomó la 
decisión de simular los meses mencionados para los años 2011 y 2013. 


En cuanto a las curvas de gasto, para el caso de la estación de Puente 
Florencia, los valores máximos de caudal cercanos a los 60 m/s se 
pueden dar a una altura de nivel de agua de 5 m; en la Estación 
Hidrológica de Tocancipá, los valores máximos de caudal están cercanos 
a los 50 m3/s y se pueden presentar a una altura de nivel de agua de 
cinco metros. 


En cuanto a las secciones transversales del modelo, se suministraron los 
puntos de medición obtenidos por medio de batimetría en el terreno. Se 
ingresaron 151 secciones en el tramo elegido, con una distancia que 
varía entre los 100 y 800 m de longitud, dependiendo de la forma del 
cauce; es decir, en zonas con curvas muy cerradas, se hizo la medición 
a distancias más cortas. 


Por otro lado, el coeficiente de Manning fue calibrado según la superficie 
de rozamiento constante del agua y la superficie de menos rozamiento 
en las zonas laterales del cauce. 


Para la calibración del modelo hidráulico unidimensional simulado en 
HEC-RAS, se comenzó mediante la identificación de un hidrograma 
simple, en el que se viera una onda sin distorsiones, en un periodo 
donde se presentan caudales medios en el tramo estudiado, empleando 
coeficientes de Manning en un rango de 0.021 a 0.04 en todas las 
secciones transversales (Santos, Cubillos, € Vargas, 2008; Cook € 
Merwade, 2009). Teniendo en cuenta las características anteriormente 
descritas, se eligió el periodo del 12 al 23 de julio del año 2010, donde 
se ingresaron los hidrogramas de la estación de Puente Florencia y el 
caudal de las 12 subcuencas calculadas. 


Luego de la calibración del coeficiente de Manning se simularon tres 
escenarios (enero, abril-junio y octubre), para los años 2011 y 2013. 
Con respecto al parámetro ubicado en la última sección transversal, 
correspondiente a la Estación de Tocancipá, o salida del modelo, se 
configuró con profundidad normal (Normal Depth) de valor 0.0001, el 
cual es adecuado para situaciones donde el flujo se aproxime al 
uniforme (US Army Corps Engineers € Hydrologic Engineering Center, 
2006). 


Modelación en redes neuronales artificiales 
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Para la simulación con RNA se utilizó el toolbox del software Matlab 
20139, empleando los datos de los caudales de la estación de Puente 
Florencia y de las 12 subcuencas del tramo escogido como entrada, y los 
caudales de la estación de Tocancipá, como salida del modelo. 


Antes los datos deben ser normalizados en un rango de -1 a 1 
(Matworks, 2013), generando una matriz de entrada al modelo con los 
caudales de la estación de Puente Florencia y de las 12 subcuencas del 
tramo escogido. La salida del modelo es un vector con los datos 
calculados por la RNA de los caudales en la Estación de Tocancipá. 


Para el entrenamiento de la RNA y su pronóstico con exactitud es 
necesario dividir los datos en dos partes. Unos de entrenamiento (70%): 
se emplearon los datos de los meses de septiembre de 2009 a diciembre 
de 2012, incluyendo los meses de febrero, marzo, julio, agosto y 
septiembre de 2013. Para el pronóstico se tomó el 30% restante con los 
datos de los meses de enero, abril, mayo, junio y octubre de los años 
2011 y 2013. 


La configuración del toolbox de Matlab% se estableció con una clase de 
entrenamiento tipo back propagation (Kia et al., 2011; Chen et al., 
2010). Asimismo, la función de aprendizaje elegida fue Levenberg- 
Marquardt (trainlm), siendo más rápida cuando se utiliza este tipo de 
entrenamiento en redes de gran tamaño, realizando mejor la función de 
ajuste para el reconocimiento de patrones del sistema trabajado 
(Matworks, 2013). Además, se configuraron los siguientes parámetros 
en el toolbox para correr el modelo: un máximo de 2 000 iteraciones 
(repeticiones), gradiente mínimo de 1e-05 y un máximo de seis 
revisiones de validación para evaluar la calidad del modelo. 


Por otro lado, para cada escenario entrenado se utilizó una estructura 
multicapa (Kia et a/., 2011; Siou, Johannet, Borrell, € Pistre, 2011), 
modificando el número de capas (entre 2 y 20) y neuronas (entre 2 y 
50). En total, se realizaron 168 escenarios, los cuales se dividieron 
según su función de propagación en las capas de entrada y ocultas, 
respectivamente: 85 con la configuración Sigmoidal-Sigmoidal, y 83 con 
la configuración Sigmoidal-Lineal. Para cada escenario se hizo la 
simulación del pronóstico y con los resultados obtenidos se hallaron 
cada uno de los estadísticos para observar la eficiencia del modelo 
mediante el desarrollo de un programa realizado en Matlab9. 


Criterios de evaluación estadística de los modelos 
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Luego de las simulaciones que arrojaba el hidrograma de salida en la 
Estación de Tocancipá de cada uno de los periodos, se compararon con 
los datos reales presentados en los mismos lapsos. El análisis se hizo a 
través de seis índices estadísticos usados en la mayoría de artículos 
observados y utilizados como métricas de evaluación de modelos 
simulados (Dawson, Abrahart, € See, 2007): error medio absoluto 
(MAE, por su nombre en inglés) (Singhal 8 Swarup, 2011); error medio 
cuadrático (MSE, por su nombre en inglés) (Gomes 8: Ludermir, 2013); 
error porcentual absoluto de la media (MAPE, por su nombre en inglés) 
(Lewis, 1982); raíz cuadrada del error cuadrático medio (RMSE, por su 
nombre en inglés) (Singhal 8£ Swarup, 2011); coeficiente de correlación 
de Pearson (CC, por su nombre en inglés) (Lin, Hedayat, Bikas, € Yang, 
2002), y coeficiente de correlación de concordancia (pc, por su nombre 
en inglés) (Lin, 2011). 


Además de lo anterior, los resultados obtenidos en esta investigación se 
compararon con el test de hidrología “HydroTest Statistical Assessment 
of Hydrological Forecasts”, el cual evalúa 20 métricas estadísticas 
reportadas en estudios de modelamiento hidrológico (Dawson et al., 
2007). Se evaluaron cuatro métricas de este test, donde se ingresaron 
los datos reales y los datos modelados (HEC-RAS, RNA Sig-Lin y RNA 
Sig-Sig), correspondientes a 30% de los datos seleccionados para 
validación. 


Resultados 


Los resultados del modelo simulado en HEC-RAS se encuentran en la 
Tabla 2, con los seis estadísticos, en los cuales se observa un pc, con un 
valor de 0.86; esto indica que el modelo tiene una alta relación de los 
datos reales en contra de los datos simulados en cuanto a exactitud y 
precisión. El coeficiente de correlación (CC) indica que se presenta un 
error de la relación del dato simulado inferior al10%, es decir que el 
error es bajo. Los valores de MAE, MSE y RMSE son bajos, lo que indica 
diferencias pequeñas con respecto a los datos reales, ello se evidencia 
en un buen pronóstico, pues el valor del MAPE se encuentra entre 11 y 
20% (Lewis, 1982). 
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Tabla 2. Resultados estadísticos, comparación de datos reales contra 
datos simulados en HEC-RAS. 


Estadístico pc cc MAE MAPE MSE RMSE 
Valor 0.8601 | 0.9077 | 2.2311 11.9535 15.7725 3.9715 


Luego de la simulación del modelo con RNA y la organización de los 
datos simulados con respecto a los estadísticos evaluados, se eligieron 
los tres escenarios con mayores valores totales de los criterios 
estadísticos MAE, MAPE, MSE, RMSE, CC y pc para cada una de las 
configuraciones de la red. En la Tabla 3 se recopilan los mejores tres 
escenarios obtenidos en el modelo de RNA de cada configuración. 


Tabla 3. Mejores escenarios RNA. 


c 5) [0] S S S 
S 0 E A E E 
a 7 (7 Y v e a 
F ., + L Y L Y L u L L 
uncion o ss ss E o e ES 
13) AS AS U lo U U 
< e Ú > 5) 2 SS Se 2 
Criterio P. cc MAE MAPE MSE RMSE 
Escenario 3 | 0.8639 | 0.9032 | 2.0652 | 13.4254 | 12.2868 | 3.5052 
Sigmoidal- , 
Sigmoidal | EScenario 4 | 0.8667 | 0.9035 | 2.0604 | 13.4697 | 12.2299 | 3.4971 
Escenario 9 | 0.8770 | 0.9215 | 1.9007 | 11.9590 | 10.1782 | 3.1903 
Escenario 2 | 0.8729 | 0.9136 | 1.9462 | 12.5194 | 10.9753 | 3.3129 
oe Escenario 3 | 0.8593 | 0.9108 | 2.0435 | 12.6997 | 11.6512 | 3.4134 
Escenario 6 | 0.8731 | 0.9104 | 1.9834 | 13.0086 | 11.3318 | 3.3663 


Discusión 


Luego de analizar todos los criterios estadísticos de los mejores 
escenarios elegidos, el mejor escenario de función de propagación 
Sigmoidal-Sigmoidal es el número 9, el cual estaba compuesto por 20 
capas con 25 neuronas cada una, debido a que cumple con la mayor 
cantidad de resultados favorables en los estadísticos: menor MAE 
(1.90), menor MAPE (11.9%), menor MSE (10.2), menor RMSE (3.2), 
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mayor CC (0.92) y mayor pc (0.88). Tomando como referencia el 
resultado obtenido con el MAPE, se observa que el pronóstico arrojado 
es bueno, pues se encuentra entre un rango entre 11 y 20% (Lewis, 
1982), y el CC indica que el modelo presenta un 92% de precisión del 
pronóstico en cuanto a la relación de los datos reales con los simulados. 


Sobre la función de propagación Sigmoidal-Lineal, se eligió el escenario 
2 como el de mejor pronóstico, el cual estaba compuesto por dos capas 
con 50 neuronas cada una, porque cumple con la mayor cantidad de 
resultados favorables en los criterios estadísticos evaluados: menor MAE 
(1.94), menor MAPE (12.5%), menor MSE (10.97), menor RMSE (3.1) y 
mayor CC (0.914). 


Con respecto al número de neuronas, las dos configuraciones arrojaron 
el mejor pronóstico, con una cantidad considerable de ellas en cada 
capa. 


Comparación del modelo físico y los modelos de 
inteligencia artificial 


Se encontraron investigaciones que comparan modelos matemáticos, 
como las regresiones lineales o la regresión múltiple, con sistemas 
artificiales inteligentes, las cuales concluyen que los sistemas 
inteligentes poseen un mayor grado de relación entre el dato real contra 
el dato simulado (Aqil et al., 2007; Firat 8 Gúngór, 2007; Kisi, Shiri, € 
Nikoofar, 2012;  Karimi, Kisi,  Shiri, €  Makarynskyy, 2013), 
proporcionando un mejor pronóstico que los modelos matemáticos. Sin 
embargo, en la bibliografía consultada no se evidencian estudios que 
realicen una comparación con un modelo físico, basado en hidráulica o 
hidrología tradicional, razón por la cual se realizó esta comparación. De 
igual manera, se encontró que se utilizan los criterios estadísticos 
tradicionales (CC, MAE, MAPE, RSME), pero ninguno con un análisis a 
través del coeficiente de correlación de concordancia (pc), el cual indica 
la relación entre precisión y exactitud del modelo (Firat € Gúrgór, 
2007). 


A partir de los resultados obtenidos se comparó el modelo físico 
simulado en el software HEC-RAS con los dos mejores modelos de RNA 
simulados en Matlab%, En la Tabla 4 se muestran los resultados de los 
tres mejores modelos. Los datos obtenidos sugieren que los modelos 
indican resultados de pronósticos muy similares, mostrando en orden de 
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efectividad primero el RNA sigmoidal-sigmoidal, segundo el RNA 
sigmoidal-lineal y por último el modelo HEC-RAS. 


Tabla 4. Resultado de los mejores modelos HEC-RAS y RNA. 


E S S S 
S 3 53 
A) L S L 5 L M pm L 
+= no no u 
ES se se 3 a 9 E 
Ú AS AS U lo U U 
< > 3) > 3) = SES = = 
Modelo Pp. cc MAE MAPE MSE RMSE 
HEC-RAS 0.8601 0.9077 2.2311 11.9535 15.7725 3.9715 
e pgs 0.877 0.9215 1.9007 11.959 10.1782 3.1903 
RNA Sig-Lin 0.8729 0.9136 1.9462 12.5194 10.9753 3.3129 


En la Figura 3 se comparan los tres mejores modelos utilizados en la 
investigación (HEC-RAS, RNA sigmoidal-sigmoidal y RNA sigmoidal- 
lineal) y la relación de los datos reales con los simulados a través de una 
línea de referencia. Cabe aclarar que para esta simulación se emplea 
30% de los datos totales de caudal para validar los modelos. 


En la Figura 3 se observa que existen datos de caudal de salida en la 
estación de Tocancipá reales contra los simulados, que están por encima 
y debajo de la línea de referencia; si los datos están por encima, el 
pronóstico del caudal sería sobrestimado; si los datos están por debajo, 
el pronóstico del caudal sería subestimado. 
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Datos reales 
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Figura 3. Relación entre los datos reales vs. datos simulados en cada 
uno de los modelos. 


Observando las gráficas se aprecia que el modelo de la Figura 3a con 
HEC-RAS subestima los caudales de salida, pues la mayoría de los datos 
se encuentra debajo de la línea de referencia; esto significa que podría 
no lograr predecir niveles de inundación. Por el contrario, los datos 
pronosticados por las RNA (figuras 3b y 3c) tienen una dispersión de 
datos más homogénea, apreciando datos por encima y debajo de la 
línea de referencia, lo cual indica que tendrían una mayor posibilidad de 
predecir niveles de inundación para caudales altos a la salida del 
modelo. 


Observando la Tabla 4 se puede identificar que el mejor de los modelos 
de RNA es el de configuración sigmoidal-sigmoidal por los resultados en 
los estadísticos hallados. Luego de seleccionar el mejor de los modelos 
inteligentes se procedió a realizar los hidrogramas, comparando los 
datos de caudal reales con los simulados, para un periodo de altas 
precipitaciones, como abril de 2011. 


Al analizar el hidrograma de la Figura 4a del modelo en HEC-RAS se 
observa que los valores simulados están por debajo de los reales, lo cual 
significa que el modelo físico no predice de modo adecuado caudales 
reales que se habían presentado en ese periodo; por tanto, el modelo no 
sería fiable para predecir eventos de inundación futuros. 


Por otro lado, observando la Figura 4b, el modelo de RNA seleccionado 
logra predecir de mejor forma los caudales reales en el mismo periodo 
de la figura anterior, sin embargo fluctúa alrededor de los datos reales, 
lo que se evidencia en la gráfica de dispersión de la figura 3b. 


a) Hidrograma, datos reales vs. HEC-RAS. 
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Comparación hidrogramas Abril de 2011 
Real vs. Simulado Hec-Ras 
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b) Hidrograma, datos reales vs. ANN. 
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Figura 4. Comparación hidrogramas reales vs. simulados en cada uno 
de los mejores modelos. 


Validación del modelo 


En la Tabla 5 se muestra los valores comparados de las estadísticas 
calculadas en Matlab* contra las calculadas por el Hydrotest; además, 
se incluyen tres criterios estadísticos adicionales: coeficiente de 
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determinación (RSQR, por su nombre en inglés) (Pearson, 1896); índice 
de acuerdo con Willmott (loAd, por su nombre en inglés), y coeficiente 
de eficiencia (CE) (Ablan, Márquez, Rivas, Molina, 8. Querales, 2011). 


Tabla 5. Comparación de las estadísticas generadas en la modelación 
contra estadísticas generadas en Hydro Test. 


Modelo cc MAE RMSE RSQR IoAd CE 
Herramienta a Y 2 Y E Y Y Y Y 
+ + + + + + + + pa] 
o ] o z y z 
= TI = IT = I TI I I 
HEC-RAS 0.9077 0.9076 2.2311 2.1585 3.9715 3.7777 0.8237 0.9309 0.7837 
RNA Sig-Sig 0.9215 0.9204 1.9007 1.8938 3.1903 3.2106 0.8472 0.9557 0.8437 


Al comparar los valores de los estadísticos CC, MAE y RMSE, se observa 
que son muy cercanos, variando en décimas o centésimas, indicando 
que fueron hallados de forma correcta en los análisis realizados en esta 
investigación. El RSQR de los resultados se encuentra en un intervalo de 
0.801 a 0.847; ello muestra que son modelos satisfactorios, pues está 
cercano a 1.0 (Pearson, 1896), aunque cabe anotar que el modelo RNA 
de configuración sigmoidal-sigmoidal está muy cerca de ser un buen 
modelo de pronóstico. Desde el índice de acuerdo con Willmott (IoAd), 
los resultados de los dos mejores modelos simulados son buenos al 
tener valores superiores a 0.9 y, en general, muy similares en un 
intervalo de 0.93 a 0.95. El coeficiente de eficiencia (CE) sí muestra una 
gran diferencia entre los dos modelos de predicción realizados, 
rechazando el modelo físico de HEC-RAS (0.7837) con un valor inferior a 
0.8. Para los otros dos modelos con sistemas inteligentes artificiales, se 
describen como satisfactorios, con valores que se encuentran en el 
intervalo de 0.80 a 0.84, siendo este último el valor del modelo RNA 
sigmoidal-sigmoidal (Dawson et a/., 2007). 


Conclusiones 


Luego de observar los comportamientos de los dos modelos realizados 
se determinó que el modelo físico subestima los valores altos de caudal 
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pronosticados, mientras que los modelos de RNA logran aproximarse 
más a los valores reales. Sin embargo, al revisar las gráficas de 
dispersión, se observa que la variación es mayor en las RNA que en el 
modelo de HEC-RAS, aunque esta dispersión en los modelos inteligentes 
está mucho más centrada hacia la línea de referencia, lo que se logra 
identificar en los hidrogramas, donde a pesar de que los caudales 
simulados llevan a valores cercanos a los reales hay variación. 


Con respecto a los estadísticos encontrados en los modelos, se observa 
que tienen buenos resultados, que demuestran pronósticos muy 
cercanos a los datos reales y efectividad de las técnicas (MAPE, entre 
11.95 y 12.51, que indica un buen pronóstico; CC, entre 0.90 y 0.92, lo 
que muestra una buena relación entre los datos reales y los simulados; 
CCC, entre 0.84 y 0.87, que demuestra precisión y exactitud en el 
pronóstico, y RSqr, loAd y CE mayores a 0.8, lo que revela un 
pronóstico satisfactorio). Estos resultados se muestran como buenos, 
debido a que en los caudales medios y bajos la dispersión es baja en los 
dos modelos, y es donde se encuentra la mayor cantidad de los datos 
tomados para la presente investigación. 
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